body{ font-family: Helvetica; font-size: 16pt; } /* Headers */ h1,h2,h3,h4,h5,h6{ font-size: 24pt; }
En este documento se abordará una breve descripción relaciondada con la base de datos sobre la accidentalidad vehicular en la ciudad de Medellín entre los años 2014 y 2020, haciéndo énfasis en las variables más relevantes de esta base de datos como lo son la fecha de ocurrencia, las comunas y los barrios en los que se dan los incidentes y el tipo de accidentalidad sucedida, entre otros. Esto con el propósito de tener un acercamiento inicial a esta base de datos como parte del primer proyecto del curso de Técnicas de Aprendizaje Estadístico del semestre 2021-2 de la Universidad Nacional de Colombia, sede Medellín.
## Rows: 270,330
## Columns: 26
## $ FECHA_ACCIDENTE <fct> 2014-07-19 15:30:00, 2014-10-25 14:50:00, 2014-11-2~
## $ AÑO <dbl> 2014, 2014, 2014, 2014, 2014, 2014, 2014, 2014, 201~
## $ MES <fct> Julio, Octubre, Noviembre, Diciembre, Diciembre, Ag~
## $ FECHA <date> 2014-07-19, 2014-10-25, 2014-11-20, 2014-12-02, 20~
## $ HORA <fct> 15:30:00, 14:50:00, 08:00:00, 13:00:00, 19:45:00, 1~
## $ CLASE_ACCIDENTE <fct> Atropello, Atropello, Atropello, Atropello, Atropel~
## $ DISEÑO <fct> Tramo de vía, Lote o predio, Lote o predio, Lote o ~
## $ GRAVEDAD_ACCIDENTE <fct> Con heridos, Con heridos, Con heridos, Con heridos,~
## $ BARRIO <fct> Guayaquil, Guayaquil, San Benito, Corazón de Jesús,~
## $ COMUNA <fct> , , , , , , , , , , , , , , , , , , , , , , , , ,
## $ X_MAGNA <dbl> 820000, 820000, 820000, 820000, 820000, 820000, 820~
## $ Y_MAGNA <dbl> 1180000, 1180000, 1180000, 1180000, 1180000, 118000~
## $ LONGITUD <dbl> -75.70378, -75.70378, -75.70378, -75.70378, -75.703~
## $ LATITUD <dbl> 6.221415, 6.221415, 6.221415, 6.221415, 6.221415, 6~
## $ COMUNASMOD <chr> "La Candelaria", "La Candelaria", "La Candelaria", ~
## $ DIAX <int> 19, 25, 20, 2, 18, 1, 4, 18, 8, 13, 26, 2, 31, 29, ~
## $ MESX <dbl> 7, 10, 11, 12, 12, 8, 8, 8, 9, 10, 11, 9, 8, 11, 10~
## $ AÑOX <dbl> 2014, 2014, 2014, 2014, 2014, 2014, 2014, 2014, 201~
## $ SEMANAX <dbl> 29, 43, 47, 48, 51, 31, 31, 33, 36, 41, 48, 35, 35,~
## $ SEMANAXX <chr> "29", "43", "47", "49", "51", "31", "32", "34", "37~
## $ DIA_SEMANA <chr> "sábado", "sábado", "jueves", "martes", "jueves", "~
## $ MES_SEMANA <chr> "julio", "octubre", "noviembre", "diciembre", "dici~
## $ FESTIVO <dbl> 0, 0, 0, 0, 0, 0, 0, 1, 0, 1, 0, 0, 0, 0, 0, 0, 0, ~
## $ FLORES <dbl> 0, 0, 0, 0, 0, 1, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, ~
## $ FUTBOL <dbl> 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, ~
## $ QUINCENA <dbl> 0, 0, 1, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, ~
La base de datos de accidentalidad de Medellín recoge todos los accidentes que sucedieron en la ciudad de Medellín, Antioquia (Colombia) entre el lunes 14 de julio de 2014 y el lunes 31 de agosto de 2020, recogiendo algunos aspectos de cada uno de estos incidentes viales como la clase de accidente observado, la dirección en la que ocurrió, el código del expediente y su número de radicado, la fecha y hora y la ubicación en coordenadas geográficas. En general, las variables a considerar por esta base de datos son las siguientes:
A continuación se puede observar una descripción general de las variables más importantes de esta base de datos.
| No | Variable | Stats / Values | Freqs (% of Valid) | Graph | Valid | Missing | |||||||||||||||||||||||||||||||||||||||||||||||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 1 | FECHA_ACCIDENTE [factor] |
|
|
270330 (100.0%) | 0 (0.0%) | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| 2 | AÑO [numeric] |
|
|
270330 (100.0%) | 0 (0.0%) | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| 3 | MES [factor] |
|
|
270330 (100.0%) | 0 (0.0%) | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| 4 | FECHA [Date] |
|
2251 distinct values | 270325 (100.0%) | 5 (0.0%) | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| 5 | HORA [factor] |
|
|
270330 (100.0%) | 0 (0.0%) | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| 6 | CLASE_ACCIDENTE [factor] |
|
|
270330 (100.0%) | 0 (0.0%) | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| 7 | DISEÑO [factor] |
|
|
270330 (100.0%) | 0 (0.0%) | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| 8 | GRAVEDAD_ACCIDENTE [factor] |
|
|
270330 (100.0%) | 0 (0.0%) | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| 9 | BARRIO [factor] |
|
|
270330 (100.0%) | 0 (0.0%) | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| 10 | COMUNA [factor] |
|
|
270330 (100.0%) | 0 (0.0%) | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| 11 | X_MAGNA [numeric] |
|
25875 distinct values | 270330 (100.0%) | 0 (0.0%) | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| 12 | Y_MAGNA [numeric] |
|
26182 distinct values | 270330 (100.0%) | 0 (0.0%) | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| 13 | LONGITUD [numeric] |
|
26667 distinct values | 270330 (100.0%) | 0 (0.0%) | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| 14 | LATITUD [numeric] |
|
26667 distinct values | 270330 (100.0%) | 0 (0.0%) | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| 15 | COMUNASMOD [character] |
|
|
270330 (100.0%) | 0 (0.0%) | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| 16 | DIAX [integer] |
|
31 distinct values | 270325 (100.0%) | 5 (0.0%) | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| 17 | MESX [numeric] |
|
12 distinct values | 270325 (100.0%) | 5 (0.0%) | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| 18 | AÑOX [numeric] |
|
|
270325 (100.0%) | 5 (0.0%) | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| 19 | SEMANAX [numeric] |
|
53 distinct values | 270325 (100.0%) | 5 (0.0%) | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| 20 | SEMANAXX [character] |
|
|
270325 (100.0%) | 5 (0.0%) | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| 21 | DIA_SEMANA [character] |
|
|
270325 (100.0%) | 5 (0.0%) | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| 22 | MES_SEMANA [character] |
|
|
270325 (100.0%) | 5 (0.0%) | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| 23 | FESTIVO [numeric] |
|
|
270330 (100.0%) | 0 (0.0%) | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| 24 | FLORES [numeric] |
|
|
270330 (100.0%) | 0 (0.0%) | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| 25 | FUTBOL [numeric] |
|
|
270330 (100.0%) | 0 (0.0%) | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| 26 | QUINCENA [numeric] |
|
|
270330 (100.0%) | 0 (0.0%) |
Generated by summarytools 1.0.0 (R version 4.0.5)
2021-11-28
A continuación se observa una tabla de frecuencias para los años de los incidentes registrados en la base de datos de incidentes.
| Frecuencia | Válidos (%) | Válidos acum. (%) | Total (%) | Total acum. (%) | |
|---|---|---|---|---|---|
| 2014 | 22352 | 8.27 | 8.27 | 8.27 | 8.27 |
| 2015 | 46066 | 17.04 | 25.31 | 17.04 | 25.31 |
| 2016 | 46991 | 17.38 | 42.69 | 17.38 | 42.69 |
| 2017 | 46109 | 17.06 | 59.75 | 17.06 | 59.75 |
| 2018 | 43300 | 16.02 | 75.77 | 16.02 | 75.77 |
| 2019 | 45795 | 16.94 | 92.71 | 16.94 | 92.71 |
| 2020 | 19717 | 7.29 | 100.00 | 7.29 | 100.00 |
|
|
0 | NA | NA | 0.00 | 100.00 |
| Total | 270330 | 100.00 | 100.00 | 100.00 | 100.00 |
Como se observa, los años 2015 a 2019 tienen aproximadamente la misma cantidad de observaciones en cada uno de ellos, lo cual es de esperar porque para todos ellos se cubre la totalidad del año, mientras que para los años 2014 y 2020 solo se cubre una parte de ellos. En todo caso, es interesante observar que el año en el que más accidentes se observaron fue el 2016, con 46,991 incidentes en total, lo cual representa el 17.38 % del total de observaciones. Gráficamente, se puede visualizar mediante el siguiente gráfico de barras:
La clase de accidente es una variable categórica de orden nominal que define de forma generar las características del incidente observado, de manera que esta variable puede asumir cualquiera de los siguientes niveles:
Teniendo esto presente, se puede definir la siguiente tabla de frecuencias para esta base de datos:
| Frecuencia | Válidos (%) | Válidos acum. (%) | Total (%) | Total acum. (%) | |
|---|---|---|---|---|---|
| (Empty string) | 6 | 0.00 | 0.00 | 0.00 | 0.00 |
| Atropello | 25313 | 9.36 | 9.37 | 9.36 | 9.37 |
| Caída del ocupante | 24138 | 8.93 | 18.30 | 8.93 | 18.30 |
| Choque | 180431 | 66.74 | 85.04 | 66.74 | 85.04 |
| Incendio | 35 | 0.01 | 85.05 | 0.01 | 85.05 |
| Otro | 30039 | 11.11 | 96.16 | 11.11 | 96.16 |
| Volcamiento | 10368 | 3.84 | 100.00 | 3.84 | 100.00 |
|
|
0 | NA | NA | 0.00 | 100.00 |
| Total | 270330 | 100.00 | 100.00 | 100.00 | 100.00 |
De la tabla anterior se puede observar que el tipo de accidente más frecuente es el choque, pues se observaron un total de 180,431 incidentes de tráfico que involucraron a este tipo de colisiones, lo que representa al 66.75 % de los accidentes, lo cual es llamativo porque resulta más de dos terceras partes de todos los incidentes ocurridos en la ciudad de Medellín entre el año 2014 y 2020. A continuación se tienen a los incidentes que no clasifican en ninguna de las categorías propuestas por Informe Policial de Accidentes de Tránsito, IPAT, es decir, los que se etiquetan como “otro”, dado que el 11,11 % de los incidentes registrados clasifican en esta categoría. En tercer lugar se tiene a los atropellamientos que abarcan al 9.36 % de los accidentes de tránsito observados en Medellín en el periodo mencionado. Por último, vale destacar que el tipo de incidente menos frecuente de todos es el que involucra a incendios, ya que durante este periodo solo sucedieron 35 eventos de este tipo, lo cual se evidencia en el siguiente gráfico de barras, pues la barra asociada a este tipo de incidente ni siquiera es apreciable, toda vez que las colisiones opacan al resto por su alta frecuencia relativa.
Uno de los aspectos más importantes a la hora de evaluar un incidente de tránsito es caracterizar el tipo de espacio en el que sucedió el accidente en términos de la infraestructura física, y esta característica es determinada en la base de datos en la variable “diseño”, que resulta siendo una variable categórica con un nivel nominal, y se describen los siguientes tipos de infraestructura:
Y una tabla de frecuencias relacionada a esta variable es la siguiente:
| Frecuencia | Válidos (%) | Válidos acum. (%) | Total (%) | Total acum. (%) | |
|---|---|---|---|---|---|
| (Empty string) | 713 | 0.26 | 0.26 | 0.26 | 0.26 |
| Ciclorruta | 1040 | 0.38 | 0.65 | 0.38 | 0.65 |
| Glorieta | 6756 | 2.50 | 3.15 | 2.50 | 3.15 |
| Intersección | 43935 | 16.25 | 19.40 | 16.25 | 19.40 |
| Lote o predio | 27104 | 10.03 | 29.43 | 10.03 | 29.43 |
| Paso a nivel | 125 | 0.05 | 29.47 | 0.05 | 29.47 |
| Paso elevado | 1399 | 0.52 | 29.99 | 0.52 | 29.99 |
| Paso inferior | 678 | 0.25 | 30.24 | 0.25 | 30.24 |
| Pontón | 34 | 0.01 | 30.25 | 0.01 | 30.25 |
| Puente | 1064 | 0.39 | 30.65 | 0.39 | 30.65 |
| Tramo de vía | 187319 | 69.29 | 99.94 | 69.29 | 99.94 |
| Túnel | 107 | 0.04 | 99.98 | 0.04 | 99.98 |
| Vía peatonal | 56 | 0.02 | 100.00 | 0.02 | 100.00 |
|
|
0 | NA | NA | 0.00 | 100.00 |
| Total | 270330 | 100.00 | 100.00 | 100.00 | 100.00 |
Revisando la tabla anterior se tiene que la infraestructura vial en la que más incidentes de tránsito sucedieron en Medellín entre el 2014 y el 2020 es el tramo de vía, pues en estos se dieron el 69,45 % del total de accidentes observados en la ciudad de Medellín en el periodo mencionado, lo cual es bastante lejano al resto de incidentes. Además, es llamativo observar que el segundo tipo de infraestructura donde más incidentes se dieron son las intersecciones, donde ocurrieron el 16.30 % de los incidentes. Además, donde menos incidentes ocurrieron fue en los pasos inferiores, ya que únicamente el 0.25 % de los accidentes ocurrieron en este tipo de vías.
| Frecuencia | Válidos (%) | Válidos acum. (%) | Total (%) | Total acum. (%) | |
|---|---|---|---|---|---|
| Abril | 19293 | 7.14 | 7.14 | 7.14 | 7.14 |
| Agosto | 27001 | 9.99 | 17.12 | 9.99 | 17.12 |
| Diciembre | 23243 | 8.60 | 25.72 | 8.60 | 25.72 |
| Enero | 20098 | 7.43 | 33.16 | 7.43 | 33.16 |
| Febero | 22214 | 8.22 | 41.37 | 8.22 | 41.37 |
| Julio | 25018 | 9.25 | 50.63 | 9.25 | 50.63 |
| Junio | 20314 | 7.51 | 58.14 | 7.51 | 58.14 |
| Marzo | 21499 | 7.95 | 66.10 | 7.95 | 66.10 |
| Mayo | 21249 | 7.86 | 73.96 | 7.86 | 73.96 |
| Noviembre | 22319 | 8.26 | 82.21 | 8.26 | 82.21 |
| Octubre | 23953 | 8.86 | 91.07 | 8.86 | 91.07 |
| Septiembre | 24129 | 8.93 | 100.00 | 8.93 | 100.00 |
|
|
0 | NA | NA | 0.00 | 100.00 |
| Total | 270330 | 100.00 | 100.00 | 100.00 | 100.00 |
| Frecuencia | Válidos (%) | Válidos acum. (%) | Total (%) | Total acum. (%) | |
|---|---|---|---|---|---|
| Altavista | 457 | 0.17 | 0.17 | 0.17 | 0.17 |
| Aranjuez | 15216 | 5.63 | 5.80 | 5.63 | 5.80 |
| Belén | 18674 | 6.91 | 12.71 | 6.91 | 12.71 |
| Buenos Aires | 9901 | 3.66 | 16.37 | 3.66 | 16.37 |
| Castilla | 25831 | 9.56 | 25.92 | 9.56 | 25.92 |
| Doce de Octubre | 6878 | 2.54 | 28.47 | 2.54 | 28.47 |
| El Poblado | 21736 | 8.04 | 36.51 | 8.04 | 36.51 |
| Guayabal | 18464 | 6.83 | 43.34 | 6.83 | 43.34 |
| La América | 8033 | 2.97 | 46.31 | 2.97 | 46.31 |
| La Candelaria | 67352 | 24.91 | 71.22 | 24.91 | 71.22 |
| Laureles - Estadio | 27978 | 10.35 | 81.57 | 10.35 | 81.57 |
| NA | 159 | 0.06 | 81.63 | 0.06 | 81.63 |
| Popular | 3822 | 1.41 | 83.05 | 1.41 | 83.05 |
| Robledo | 16485 | 6.10 | 89.15 | 6.10 | 89.15 |
| San Antonio de Prado | 4007 | 1.48 | 90.63 | 1.48 | 90.63 |
| San Cristóbal | 2756 | 1.02 | 91.65 | 1.02 | 91.65 |
| San Javier | 4313 | 1.60 | 93.24 | 1.60 | 93.24 |
| San Sebastián de Palmitas | 17 | 0.01 | 93.25 | 0.01 | 93.25 |
| Santa Cruz | 3437 | 1.27 | 94.52 | 1.27 | 94.52 |
| Santa Elena | 487 | 0.18 | 94.70 | 0.18 | 94.70 |
| Santa Manrique | 7775 | 2.88 | 97.58 | 2.88 | 97.58 |
| Villa Hermosa | 6552 | 2.42 | 100.00 | 2.42 | 100.00 |
|
|
0 | NA | NA | 0.00 | 100.00 |
| Total | 270330 | 100.00 | 100.00 | 100.00 | 100.00 |